Datos de trayectorias bastan para evaluar políticas en RL offline Nuevo estudio muestra que los datos de trayectorias bastan para evaluar políticas en RL offline con eficiencia estadística. ¡Descúbrelo! 2026-06-02 · 2 min